46. 评估指标

Nd113 C7 46 L 评估指标

准确性

分类模型的准确性是通过比较预测标签和真实标签来实现的。对于任何给定的图像,如果 predicted_label 匹配 true_label ,那么这是一个正确分类的图像;否则,这就是错误分类。

准确度由正确分类的图像的数量除以图像的总数量得到。我们将在新图像上测试这个分类模型,这被称为测试数据集。

测试数据

测试数据是以前看不见的图像数据。你 已经 看到的数据,以及你用来帮助构建分类器的数据称为训练数据,我们之前提过。创建这些数据集的想法是,创建一个能够正确分类所有这些训练图像的分类器,以及了解分类器如何在真实世界的一般情况下工作。你可以想象正在浏览训练集的图像,并创建一个能够正确分类所有这些训练图像的分类器。但是,实际上,你会创建一个分类器, 能够识别数据的一般模式 。所以当它面对现实世界的情景时,它仍然会工作!
因此,我们使用新的测试数据集,来查看分类模型在现实世界中的工作方式,并确定模型的准确性。

错误分类的图像

在这个和大多数分类的例子中,测试集中有一些错误分类的图像。要看如何改进,了解这些错误分类的图像很有用。看看哪些地方被错误标记,以及这种模型在哪些地方有问题。这将取决于你看这些图像,并考虑如何改进分类模型!